AI资讯新闻榜单内容搜索-Coding Age

Claude Code爆火背后的Agent Harness底层逻辑，UIUC、Meta、斯坦福深度解读

过去两年，大模型写代码已经不再新鲜。从代码补全到 GitHub issue 修复，从竞赛编程到仓库级软件工程，人们习惯用一个简单标准评估 coding agent：代码能不能写对？测试能不能通过？

来自主题: AI技术研报

8286 点击 2026-06-10 10:02

当前，Coding Agents 在软件工程领域一路高歌猛进，科学家们看到此场景，也不禁寄予厚望：AI 智能体何时能以同样的速度，帮人类攻克药物设计、病毒监控与生物学建模的重重难关？

来自主题: AI技术研报

9735 点击 2026-06-09 14:53

一年前，行业还在为“从自动补全到 Agent”的进化感到兴奋。然而一年过去，我们不难发现单纯靠“Vibe Coding”和“Prompt 调优”，面对非确定性模型带来的风险和成本问题，显然无法撑起企业级软件开发。

来自主题: AI技术研报

6625 点击 2026-06-09 09:37

如今的 AI Agent 正在大规模落地，其中应用最广且最受关注的当数 Claude Code，Codex，Cursor 这类 coding agent。过去的一年里，这类 coding agent 产品迭代迅速，在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报

6888 点击 2026-05-19 10:00

OpenAI 的两大宿敌 Anthropic 和马斯克，放下心中成见之后终于在月初结盟了。

来自主题: AI资讯

7199 点击 2026-05-18 16:51

Mechanize 发布了一项硬核测试：给前沿 AI coding agents 24 小时，用 Rust 从零写一个完整的 Game Boy Advance 模拟器，再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报

8009 点击 2026-05-18 16:48

没错，大洗牌之后，xAI紧锣密鼓地发上重磅新品了——首个Coding Agent，Grok Build。直接在终端运行、专为专业软件工程和复杂编程任务设计……对标的是谁，属于是摆在明面上的。

来自主题: AI资讯

9808 点击 2026-05-15 13:35

随着代码智能从 code foundation models 走向 autonomous coding agents，CLI/terminal 正在成为智能体进入真实软件工程工作流的重要入口。

来自主题: AI技术研报

5570 点击 2026-05-07 15:03

DeepSeek也有自己专属的Coding Agent了。名字简单粗暴，就叫DeepSeek-TUI，作者自称是一名“鲸鱼兄弟”的DeepSeek爱好者。刚刚，这个项目的星标数突然开始骤增，来到了2.3k，还登上了GitHub热榜。

来自主题: AI资讯

8817 点击 2026-05-04 13:23

今天，智谱发布了一篇名为《Scaling Pain：超大规模Coding Agent推理实践》的技术报告，披露了GLM-5系列模型在Coding Agent场景下遇到的推理基础设施挑战与对应解法。

来自主题: AI技术研报

9689 点击 2026-04-30 13:52